2021年9月5日,笔者在北京蓝调庄园参加了 DAMA 中国举行的 CDGP(数据治理专家)考试。这次参加考试,距离今年6月通过 CDGA 时间不算长,复习仓促,没有太大把握,考后心情尤为忐忑。孰料17日获知成绩,居然通过了,欣喜之余又颇觉庆幸。 毕竟参加 CDGP 考试的感觉和 CDGA 又有很大不同,几道主观论述题答得满头大汗。这次能通过,确有几分运气成分在内。考试不易,在此对两次考试的经验做一个小小的总结,希望能对后续有志于参与DAMA中国CDGA/CDGP考试的朋友有所帮助。 0. 关于DAMA中国和CDGA/CDGP考试 国际数据管理协会(DAMA国际)是一个全球性的专业组织,由数据管理和相关的专业人士组成,非营利性机构,厂商中立。协会自1980年成立以来,一直致力于数据管理和数字化的研究、实践及相关知识体系的建设,先后发行了《DAMA 数据管理字典》和《DAMA数据管理知识体系》等。该知识体系目前已被广泛使用,并已成为业界的标杆和权威。 为紧贴国内数据治理和数字化的发展趋势,2020年10月起,国际数据管理协会中国分会(DAMA中国)对DAMA国际数据管理专业人员认证( CDMP )的考试语言、考试形式、考试内容、证书类型等进行了适当本地化重构。重构后认证考试分为数据治理工程师—CDGA( Certified Data Governance Associate)和数据治理专家—CDGP( Certified Data Governance Professional )。DAMA中国承担认证考试命题工作,并定期组织中文考试,对考试通过者由DAMA中国颁发认证证书。 中文版的CDGA、CDGP和英文版的CDMP证书国际通用,行业认可,是数据管理领域最专业的职业认证之一。 以上内容引自DAMA中国官方公众号文章(链接:https://mp.weixin.qq.com/s/VyQjNo3ePP90JIs79lRI4Q) 了解更多DAMA认证考试内容,点击阅读: 一文读懂DAMA数据治理工程师认证考试(内含福利)
近二十年IT从业经验,一直在软件研发领域的项目。目前主要从事信息系统项目管理及系统分析设计类工作,但没有专门从事数据治理项目的经验。 2021年初了解到 DAMA 中国的认证,为拓展知识领域及项目的需要,6月份报名参加了入门级 CDGA 考试,成绩81分。通过后于9月再报 CDGP 并通过,成绩72分。 2. CDGA 考试总结 2.1 我的复习方法 主要方式就是看书,包括《DAMA-DMBOK2 数据管理知识体系指南》和《穿越数据的迷宫:数据管理执行指南》,这两本书在网络都有售卖。
其中后者可以看作是前者的简化版本,便于从宏观上掌握 DMBOK2 的纲要,主要的还是靠DAMA-DMBOK2 来学习,对这本教材我一共看了四遍: 通读教材,了解基本内容和不同知识领域自己的掌握情况,做到心中有数 精读教材,结合笔记、思维导图系统梳理知识点,这一遍时间最长 结合了数贝(厦门数贝信息科技有限公司提供的“databok数据课”,可以在微信中搜索到小程序“数贝”)提供的练习题进行模拟训练,对训练过程中出错的题目反向查找知识点进行强化学习,加深理解 当然,实际的学习过程可没有说起来这么轻松,建议大家还是投入相当的时间和精力去学习。 2.2 心得体会 1、对于 CDGA 考试,全是单选题,个人觉得最重要的就是对概念的清晰理解和把握,因此许多东西确实是要“背”的。对于重要章节,如数据治理、数据架构、建模与设计、元数据、数据质量、数据安全、数据仓库和商务智能等,应该较为全面的学习;而对于其它次重要章节,则一定要重视语境关系图,把每个知识领域的目标、原则、输入、活动、交付成果、参与人员、方法、工具、度量指标等搞清楚。这些知识点相当零碎,要想全背诵下来,还是不太现实的,但多看几遍你就会找到一些语感,考试时凭直觉不会犯重大错误。 2、正因为无法做到精确背诵,在考试时有些模糊的题目,我尽量做到以第一感觉为主,不想太多。 3、做模拟题有一定的作用,确实有一些题目会押中,但比例不大,还是要靠学习为主,模拟题主要是帮助进行知识点回顾。 4、如果有一些信息系统相关的经验,有些题目对你来说就很简单了。例如数据建模相关的。 5、务必注意考试时间,我是等最后快没时间了才做完(毕竟有些题目还是举棋不定,耽误了时间,100道题目100分钟,需要快速做决定),后面十几分钟手忙脚乱地填涂答题卡,没有多少时间检查。 6、现在看,CDGA 还是相对简单的,相关概念清楚,配合一些经验和常识,即使没见过,也有一定的机率“蒙”对,但为了提高这个机率,还是努力看书吧! 3.CDGP 考试心得 3.1 我的复习方法 对于 CDGP,我丝毫不敢掉以轻心。一方面是参加 CDGA 时发现自己确实掌握得不牢固,另一方面也知道CDGP 不像 CDGA 题目类型简单,有10道单选题,15道多选题,后面几道大题内容和出题方式都未知。因此在初期的复习是有些茫然的,所幸参加了数贝提供的公开培训,了解了 CDGP 考试的相关情况,当时还做了一些要点记录: 重点包括架构设计、逻辑模型设计、性能问题解决方案、数据质量、元数据问题解决方案等; 题型包括知识点类(如数据质量问题的来源)、活动排序类(如数据科学、主数据等活动超过七个的知识领域)、开放类(结合经验论述,如集成外部数据时如何做到标准化); 尤其应当关注数据仓库与BI、大数据领域的架构设计案例、架构图; 写字工整;
写出要点,不需要长篇大论;
只要言之有理就可能得分;
有些题目可能会有些绕弯,需要认真辨析题义。
这些内容虽然和后续我参加考试的体会并不是完全一致的(毕竟DAMA中国的老师们也在对考试进行不断迭代),但它确实驱散了眼前 CDGP 考试的一部分迷雾,为我修订自己的复习方法提供了信息支持: 我再次系统地看了一遍书,就当自己从来没看过。这一遍居然看出了不少新的体会,逐步在头脑中形成了一个整体框架,甚至可以靠回忆来把知识体系串起来了。
我手动把DMBOK2中所有认为重要的图表都画了一遍,以应对可能出现的“画图”题目。尤其是数据仓库和商务智能中的那两个架构图(CIF和数仓棋子视图),反反复复画了好几遍,直到可以“默写”,后来考试虽然没用上这两张图,但它让我对数据仓库的架构加深了理解,事实上题目中也确实有数据仓库架构类的题目。
3. 扩展阅读,我给自己制订了一个书目。不过需要注意的是,这些大部头要想在短短一两个月全部啃下来是不可能的,一方面有些书我以前已经读过了,另一方面,我主要是将这些外围知识与 DMBOK2 中的知识体系连接起来,不到于有枝无叶,所以更多是快速浏览学习。 3. 把各知识领域的语境关系图打印出来装订成了一个小本,有空就拿出来看看,几乎快背下来了(主要是想应付上文所说的“排序题”,不过也没用上,只是这回碰到单选题,几乎不用犹豫了)。 4. 最后,非常关键的一点,把数据建模与设计的知识重点复习了一下。从数贝的培训老师那里了解到,CDGP 建模是必考题,也就是针对特定的业务场景建立逻辑数据模型。作为信息系统的分析与设计人员,建模对我来说并不算陌生,但是对信息工程表示法(也就是鸭掌模型)我并不太熟悉,因此特地找了一些相关资料来学习,事实证明,用上了。 3.2 心得体会 整体上,感觉 CDGP 考试的压力还是很大的,由于有 CDGA 考试的教训,怕时间不够,我已经相当注意控制每道题的解答时间,但时间还是在不知不觉中流逝了,等我做到最后一道题目时,时间也就剩下40分钟左右,然而最后一道题目还需要建立较为复杂的数据模型,我强迫自己冷静下来,先完成了初稿,然后赶紧回去把选择题给检查了一遍,填写答题卡,然后回头又根据最后一题题意进行了模型的细节完善。时间总算还够用,谢天谢地。 1、关于单选题,没什么可说的,概念清晰的话,这些题目感觉就是送分来的。 2、多选题,有相当的难度。 尤其需要注意的是,不能完全依赖于语境关系图,它会涉及知识领域的一些细节。 印象中有一道题目,是关于主数据管理的关键处理步骤的,其中第四步“实体解析和标识符管理”的“匹配流程/协调类型”包括“重复标识匹配规则”、“匹配链接规则”、“匹配合并规则”。 这个知识点我完全没想到会出现在考试中,其结果是选错了。 另外还有一小部分是关于业务前沿概念的,比如数据交易、OneData / OneID等,这就需要平时有一定的涉猎和应用才行了。 总之,深度和广度都必须到位,否则这一部分内容是很容易失分。 3、终于说到论述类题目了,本次 CDGP 考试牵涉到的几道题目大意如下: 卫生健康委拥有海量的医疗相关数据为何不愿意公开提供服务?出于哪些考虑,如何解决? 你作为首席专家如何开展某企业的数据管理成熟度评估项目的工作? 一家拥有多分支机构的跨国企业应如何选择合适的数据治理模式? 民政局的婚姻登记数据如何在半小时内就能通过接口提供给数据需求方,需要什么样的架构? 对电影院订票系统数据建模(原题较长,其实可以参考淘票票或其它订票APP) 看到了吗? 没一道题目是让你直接回答知识点的,全部都是理论联系实际的题目。 自认为把书背得还可以的我当时看到这些题目有点蒙,不过冷静下来之后发现这些题目也没有跑出复习的范围,上面这几道题目不就是对应了数据安全、成熟度评估、数据治理、数据仓库和商务智能(大数据)、数据建模与设计等相关章节的知识吗? 关键看你怎么应用这些知识点了。 相信大家看到这已经明白,CDGP 考试的命题者们真的是用心良苦,他们并 不希望我们通过死记硬背的方式通过考试 ——那还能称得上“数据治理专家”吗? 这必然要求你有实践经验,且能把经验上升到理论高度才能得分的。 这时候,多年从事信息系统研发的经验总算派上用场了,虽然没有绝对把握,每道题至少有自己的见解可以发表。 关于前几道论述题,大家完全可以在书上找到相关的知识点,这里只分享一下最后一道建模题,我的解答方法: 1)快速通读业务场景描述,用笔划出论述中的名词,在大脑中建立一个概念模型(也就是牵涉到的实体,不考虑它们的属性),并且你需要考虑一下你画图的布局,毕竟你是在用笔画图而不是用电脑,无法方便地修改模型的位置。把这些实体的名称按你预想的位置画到答题纸上,先不要画属性,根据预估留出空白。 2)结合材料对概念模型进行完善,把属性加上,注意一部分是实体本身的属性,另一部分是用于建立关联的外键属性。只要想到了就写上,对于主键标上PK,外键标上FK。 3)对实体之间的关系绘图,可能需要根据业务逻辑建立一些用于关联的实体,这些实体原文中是没有的。把实体用线联接,并把关系的元数做好标记。 5)在实际操作中,这个过程需要快速思考和设计,我画的时候出现了好几次考虑不周,把画好的实体又添加上属性的情况,不过时间太紧张,也算情有可原吧。有同考的伙伴建议可以拿准考证当草稿纸,先把概念模型布局给画上,这样正式画图之前会胸有成竹一些,可惜当时我没想到这一点,否则模型的布局就不会太凌乱了,大家可以参考此做法。 4. 总结 1、多看几遍书是非常必要的,尽管 DMBOK2 这本书很厚,知识点繁杂,很容易让人感觉千头万绪。但是世上本没有路,走的次数多了,也就踩出了一条路。 2、 类似建模这些技能,是真的有必要练习的,因为你不仅要会,而且要快。 3、CDGA 重在厘清概念,CDGP 重理论应用,这的确是一个逐步深入的过程,如果能把这个学习的过程与工作结合起来,真正形成解决问题的技能而不是仅仅应付考试,岂不更好?
<END>